Ames Fire Insurance
🔥 우리는 LS 화재보험사

에임즈(Ames) 시에 새로운 보험상품을 출시하려 합니다.
그런데 이 지역은 화재 위험도가 어떤지,
보험금은 얼마로 책정해야 수익이 날 수 있을지,
아무도 정확히 모릅니다.

  • 📦 주택 가격은 어떤지
  • 🧱 자재는 화재에 강한지
  • 🔥 위험 지역은 어디인지
  • 💰 보험 수익은 어디서 발생하는지
이제 데이터를 기반으로,
에임즈 시의 보험료를 직접 산정해보겠습니다.
📌 프로젝트 배경

최근 기후 변화노후화된 주택 문제로,
미국 내 화재 사고가 증가하고 있습니다.
캘리포니아 산불 사례처럼, 보험사는 막대한 손실을 입을 수 있습니다.

그렇다면, 우리는 사전 예측과 리스크 분석을 통해
보다 정밀한 보험료 책정이 가능할까요?

Ames Housing 데이터를 기반으로
데이터 기반 화재보험 모델을 구축합니다.
🧭 분석 흐름 요약

1️⃣ 화재 위험 시각화
2️⃣ 화재 대응 자원 분석
3️⃣ 피해액 예측 모델링
4️⃣ 보험금 산정 공식 설계
5️⃣ 추천 리스트 & 정책 제안

🗺️ 1. 위험도 기반 주택 시각화
📋 2. 화재 위험도 산정 기준표
위험도1 위험도2 위험도3 위험도4 위험도5
지붕 자재 (30%) Metal CompShg, Tar&Grv Roll, Membran WdShngl WdShake
외벽 재질(30%) MetalSd, CemntBd, BrkFace… ImStucc,Stucco VinylSd, HdBoard, AsphShn Wd Sdng, WdShing, Plywood
외벽 장식 재질(10%) MetalSd,CemntBd,BrkFace… Stucco, ImStucc VinylSd HdBoard, AsphShn Wd Sdng, WdShing, Plywood
외벽 마감재(10%) BrkFace,Stone,BrkCmn
목재 바닥 넓이(20%) 0 1~100 101~250 251~400 400
  • 지붕과 외벽은 화재 시 가장 먼저 타는 1차적 취약 요소입니다.
  • 목재 바닥은 불씨에 쉽게 착화되며,
  • 외벽 마감재와 장식은 상대적으로 위험도는 낮지만 가연성일 경우 주의가 필요합니다.

📎 자세한 기준은 NFPA 공식 가이드에서 확인할 수 있습니다.
🔗 NFPA - Preparing Homes for Wildfire

📊 3. 위험도별 주택수량 막대그래프
📊 1. 가격 & 평단 가격 시각화
📐 2. 피트당 단가 (근거)

수식 보여주고 어떤 근거로 작성했는지 했을때 효과가 무엇인지 어떻게 보여줄건지

📉 3. 가격 분포 막대그래프
📝 1에 대한 해석
  • 건물 피해 단가 기반 보험료 산정이 타당함을 확인
  • 고가 주택일수록 피해 예상액이 커짐
🔥 분석 목적 요약

화재 위험 등급이 높을수록 주택 가격이 낮은가? 위험도와 가격 간의 관계를 통계적으로 검정하고, 그 결과를 시각화와 함께 해석합니다.

📊 아노바 검정 결과
  • ✅ 위험도별 가격 평균 차이 있음
                     sum_sq      df          F        PR(>F)
C(Risk_Level)  1.140682e+07     3.0  50.181071  1.629110e-31
Residual       1.949590e+08  2573.0        NaN           NaN
검정통계량: 0.935, 유의확률: 0.000
((array([-3.46114822, -3.21474664, -3.07833849, ...,  3.07833849,
          3.21474664,  3.46114822]),
  array([-659.67449005, -651.64075552, -618.53948493, ..., 1123.79335387,
         1193.14288989, 1338.15561082])),
 (np.float64(266.25811643575116),
  np.float64(1.1203177296477131e-13),
  np.float64(0.9668625865713261)))
  • ✅ Bartlett 등분산성 검정 통과
검정통계량: 68.78141877647354, p-value: 7.78327128923569e-15
  • ✅ 사후검정(Dunnett’s Test): 일부 그룹 간 유의한 차이 존재
📊 아노바 검정 결과
{'검정통계량 (H)': np.float64(178.90374691631433),
 'p-value': np.float64(1.5212557739215267e-38),
 '결론': '✔️ 그룹 간 차이가 유의함 (p < 0.05)'}
1.0 2.0 3.0 4.0
1.0 1.000000e+00 9.105248e-17 1.000000e+00 1.941157e-01
2.0 9.105248e-17 1.000000e+00 3.678633e-31 4.735048e-08
3.0 1.000000e+00 3.678633e-31 1.000000e+00 2.790989e-01
4.0 1.941157e-01 4.735048e-08 2.790989e-01 1.000000e+00
📈 위험도별 주택가격 Box Plot
🔍 결과 해석
  • 평균 가격:
    위험도 1 < 2 < 3 < … < 5
    위험도가 높을수록 평균 가격은 낮은 경향

  • 하지만,
    위험도가 낮다고 가장 비싼 집은 아님

  • 가격은 취향 차이, 재료, 위치 등의
    다양한 요인의 영향을 받음

📌 결론 요약
  • 🔥 화재 위험도는 가격에 통계적으로 유의미한 영향을 미칩니다.
  • 🏷️ 하지만, 가격은 단일 요인이 아닌 복합 요인의 결과입니다.
    (예: 부촌 = 안전 + 디자인 + 입지)
📌 분석 목적

거래가 없는 주택에도 적용 가능한 예측 모델을 통해 보험료를 산정합니다.

🔧 보험료 예측 모델
  • 사용 모델: Lasso, Ridge, ElasticNet
  • 주요 변수: 위험도, 자재, 노후도, 평단가 등
  • 성능 평가: R², RMSE, 교차검증
# 회귀 모델 학습 및 평가 코드
🗺️ 예측 보험료 지도 시각화
  • 각 주택의 보험료 예측값을 지도에 시각화
  • 색상 = 보험료 크기, Hover 시 상세 금액 표시
# Scattermapbox 지도 시각화 코드
💰 보험료 산정 공식

예상 보험료 = 예측 피해액 × 화재 위험 가중치 × 자재 손상률 × 노후도 계수

📌 분석 목적

에임즈 전체 보험료 총합과 보장 총액을 바탕으로 손익분기점을 분석합니다.

🎯 위험-수익 매트릭스 시각화

각 구역(또는 주택)을 위험도와 수익성 축으로 표현한 4분면 분석입니다.
수익이 낮고 위험이 높은 지역은 보험 인수 대상에서 제외하는 전략이 필요합니다.

📈 손익 시나리오 그래프
# x축: 보장 비율 (%)
# y축: 수익 또는 손실 (USD)
📌 결론 요약
  • 보험료 모델로 모든 주택의 보험료 산정 가능
  • 손익 시나리오 분석을 통해 수익 구조 명확화
  • 데이터 기반 보험 전략 수립 기반 마련